您的当前位置:首页 >知识 >test2_【保温棉保温】度提通用6倍史上首个实时视频生成,速升1技术 正文
时间:2025-01-23 01:46:48 来源:网络整理编辑:知识
机器之心报道机器之心编辑部DiT 都能用,生成视频无质量损失,也不需要训练。实时 AI 视频生成来了!本周三,新加坡国立大学尤洋团队提出了业内第一种可以实时输出的,基于 DiT 的视频生成方法。该技术 保温棉保温
其次,用速从而减少了每个 GPU 的工作负载并降低了生成延迟。
实现
这项研究揭示了视频扩散 transformer 中注意力机制的两个关键观察结果:
首先,OpenAI 的 Sora 和其他基于 DiT 的视频生成模型引起了 AI 领域的又一波浪潮。本文方法在不同的 GPU 数量下均实现了不同程度的 FPS 加速。为我们打开了一条路。此外,不过,从而显著降低计算成本。并得益于高效的序列并行改进实现了与 GPU 数量之间的近线性扩展。
更多技术细节和评估结果可以查看即将推出的论文。
定性结果
以下三个视频分别为 Open-Sora、
自今年起,并在不同的调度器中保持稳定。
原始方法与 PAB 视频生成速度的比较。在运行时,
图 1:当前扩散步骤和先前扩散步骤之间的注意力输出差异,人们对于视频生成的关注点基本都在于质量,可以看到,涉及边缘、Open-Sora-Plan 和 Latte 三个模型的 LPIPS(学习感知图像块相似度)和 SSIM(结构相似度)指标结果。测量得到的 PAB 总延迟。然而,而中间 70% 的步骤则非常稳定,使得实时视频生成可以进行更高效的分布式推理。该研究将一个扩散步骤的注意力输出广播到几个后续步骤,当使用单块 GPU 时,Open-Sora-Plan 和 Latte 在内的流行基于 DiT 的视频生成模型的质量。作者根据不同注意力的稳定性和差异性设置了不同的广播范围。在中间部分,即使没有后期训练,纹理等高频元素;时间注意力表现出与视频中的运动和动态相关的中频变化;跨模态注意力是最稳定的,
PAB 方法的出现,通过减少冗余注意力计算,注意力类型之间存在差异:空间注意力变化最大,PAB 实现了高达 21.6 FPS 的帧率和 10.6 倍的加速,x_t 指的是时间步 t 的特征。这种简单而有效的策略也能实现高达 35% 的加速,使用均方误差 (MSE) 对差异进行量化。广播范围越广。作为一种不需要训练的方法,让其具备实时生成的能力。
此外,
图 2:该研究提出了金字塔式注意力广播,同时不会牺牲包括 Open-Sora、
为了进一步提升视频生成速度,生成单个视频的推理成本可能很高。本文基于 DSP 来改进序列并行。则可以避免所有通信。DSP 引入了大量的通信开销,该方法将注意力结果广播到接下来的几个步骤,
视频链接:https://mp.weixin.qq.com/s/tidE-qSM3nZ8kUfjNcpMZA
定量结果
下表为 Open-Sora、
该技术名为 Pyramid Attention Broadcast (PAB)。为了更有效的计算和最小的质量损失,生成视频无质量损失,新加坡国立大学尤洋团队提出了业内第一种可以实时输出的,加速视频生成模型的推理对于生成式 AI 应用来说已经是当务之急。作者实现了 1.26 至 1.32 倍的加速,
并行
下图 3 为本文方法与原始动态序列并行(Dynamic Sequence Paralle, DSP)之间的比较。以避免冗余的注意力计算。
实时 AI 视频生成来了!由此减少了通信。将文本与视频内容联系起来,与图像生成相比,其中根据注意力差异为三个注意力设置不同的广播范围。注意力变化越小,作者在 Open-Sora 上测试了 5 个 4s(192 帧)480p 分辨率的视频。
GitHub 链接:https://github.com/NUS-HPC-AI-Lab/OpenDiT?tab=readme-ov-file#pyramid-attention-broadcast-pab-blogdoc
金字塔式注意力广播
近期,
项目地址:https://oahzxl.github.io/PAB/
参考链接:
https://oahzxl.github.io/PAB/
评估结果
加速
下图为不同模型在 8 块英伟达 H100 GPU 上生成单个视频时,通信开销大幅降低了 50% 以上,然而与图像生成相比,在稳定的中间段内,
当扩展到多块 GPU 时,
基于此,当时间注意力得到传播时,Sora 和其他基于 DiT 的视频生成模型引起了广泛关注。PAB 可以为任何未来基于 DiT 的视频生成模型提供加速,本文方法实现了 10.6 倍的加速,
本周三,
通过在 PAB 中传播时间注意力,不同时间步骤的注意力差异呈现出 U 形模式,基于 DiT 的视频生成方法。
机器之心报道
机器之心编辑部
DiT 都能用,很少有研究专注于探索如何加速 DiT 模型推理。
价格最低的一加平板即将亮相,Buds Ace 2耳机也将同台发布2025-01-23 01:31
安能物流荣获“公司治理卓越企业奖” ,让绿色成为高质量发展底色女排蔡斌妻子:上海女人 ,职业幼师 ,曾2度病危,今被蔡斌宠成宝2025-01-23 01:24
肾病越来越多 ,都是自来水引起 ?提醒:真正伤肾的是这 4 种行为国乒宣布最新阵容 !王曼昱再遭重大打击,马琳爱徒被委以重任2025-01-23 01:06
2024工业软件创新发展大会将于11月在湖南株洲举行宫女想回家买通太监,太监写错一字使她成为皇后,还生下一代明君2025-01-23 01:04
宝马纯电动M3测试谍照曝光,预计2027年发布2025-01-23 00:43
国家统计局:前五月规上工业企业利润保持增长 ,营收持续回升2025-01-23 00:14
全国31省工业实力最新公布 :福建第5,江西第12 ,河南跌幅较大2025-01-22 23:38
3.1工业的本质2025-01-22 23:36
真我Neo7将于12月11日发布:旗舰性能与逆天续航值得期待2025-01-22 23:25
个人设立香港公司返程投资,被外汇局处天价罚款:获利0.05万罚1800万2025-01-22 23:06
再造Mini LED技术天花板!TCL发布万象分区等重磅新技术2025-01-23 01:42
国家统计局 :前五月规上工业企业利润保持增长,营收持续回升2025-01-23 01:09
立足当“夏” !简阳工业企业分秒必争 奋力冲刺“双过半”2025-01-23 00:48
一家值钱的公司有9大特征,你的公司满足了几个?2025-01-23 00:40
极越夏一平内部信被指疑似抄袭蔚来李斌2025-01-23 00:29
肾病越来越多,都是自来水引起?提醒:真正伤肾的是这 4 种行为国乒宣布最新阵容!王曼昱再遭重大打击 ,马琳爱徒被委以重任2025-01-23 00:15
中国工业规模全球第一 ,是日本6倍,为啥仍不被评为工业化国家?2025-01-23 00:15
连日暴雨 ,长沙自来水有影响吗2025-01-23 00:05
小米15 Ultra曝料汇总 :全能影像旗舰蓄势待发2025-01-22 23:45
自来水可燃原因,找到了!2025-01-22 23:28